1. Clasifique las siguientes series (discreta o continua, univariada o multivariada)
a. Índice diario de bolsa de valores durante el período de enero 1990 a diciembre 2010. R/ Continua Univariada
b. Registro de la marea en un lugar específico durante 30 días. R/ Continua Univariada
c. Presión sanguínea de una mujer durante el embarazo. R/ Continua Univariada
d. Temperatura promedio diario durante el año 2019.R/ Discreta Univariada
e. Registro diario de nacimiento y defunciones durante el año 2010. R/ Discreta Multivariada
3. En la base de datos “nacimiento1990_1995.xls” se tienen las cifras de los nacimientos mensuales inscritos en Costa Rica de enero de 1990 a diciembre de 1995.
a. Importe los datos a R.
naci <- read_excel("Datos/nacimiento1990_1995.xls",
col_names = c("Fecha","Nacimientos"))
nacits<-ts(naci$Nacimientos,frequency = 12,start=c(1990,1))
b. Elabore un gráfico de la serie.
p<-autoplot(nacits) +
labs(x ="t", y = "Nacimientos", title=" Evolución de los nacimientos (ene-90 a dic-1995)")+
theme_classic()
ggplotly(p)
decomposeNacitsAditi <- decompose(nacits,"additive")
p2<-autoplot(decomposeNacitsAditi)+
theme_bw()+
ggtitle("Descomposición Aditiva")
ggplotly(p2)
p3<-ggseasonplot(nacits, year.labels=FALSE, continuous=TRUE)+
theme_bw()
ggplotly(p3)
## Warning: `group_by_()` is deprecated as of dplyr 0.7.0.
## Please use `group_by()` instead.
## See vignette('programming') for more help
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_warnings()` to see where this warning was generated.
ggseasonplot(nacits, year.labels=FALSE, continuous=TRUE,polar = T)+
theme_bw()
c. Comente sobre las características de la serie.
4. Considere el proceso estocástico \(Z_{t}=a_{t}\) con \(t = ±1, ±2\), … y
\[ a_{t}=\left\{\begin{matrix} 1 & Prob=0.5\\ -1 & Prob=0.5 \end{matrix}\right.\]
\[ E(Z_{t})=E(Z_{t})=1\cdot0.5+-1\cdot0.5=0 \]
Caso cuando \(s \neq t\)
\[ Cov\left ( a_{t},a_{s} \right )= E[(a_{t}-\mu_{t}),(a_{s}-\mu_{s})]\] \[= E[a_{t}\cdot a_{s}] = E[a_{t}] \cdot E[a_{s}]=0\] Caso cuando \(s = t\)
\[ Cov\left ( a_{t},a_{s} \right )= Var[a_{t}]=E[a_{t}^{2}]\] \[=1^2*0.5+(-1)^0.5=1\] entonces
\[ \gamma \left ( t,s \right )=\left\{\begin{matrix} 1 & s=t\\ 0 & s \neq t \end{matrix}\right.\]
\[\rho\left ( t,s \right )= \frac{\gamma\left ( t,s \right )}{\sqrt{\gamma\left ( t,t \right ),\gamma\left ( s,s \right )}}\] Caso cuando \(s \neq t\)
\[= \frac{0}{\sqrt{1 \cdot 1}}=0\]
Caso cuando \(s = t\)
\[\rho\left ( t,t \right )= \frac{\gamma\left ( t,t \right )}{\sqrt{\gamma\left ( t,t \right ) \cdot \gamma\left ( t,t \right )}}=\] \[\rho\left ( t,t \right )= \frac{1}{\sqrt{1 \cdot 1}}=1\] entonces
\[ \rho \left ( t,s \right )=\left\{\begin{matrix} 1 & s=t\\ 0 & s \neq t \end{matrix}\right.\]
Se concluye que \(Z_{t}\) es debilmente estacionario ya que la media es constante y \(\rho \left ( t,s \right )\) no depende de t
6.Si \(\left \{X_{t}, t \in T \right \}\) y \(\left \{Y_{t}, t \in T \right \}\)son estacionarios y además independientes, defina \(Z_{t} = a \cdot X_{t} + b \cdot Y_{t}\) para todo t. ¿\(\left \{Z_{t}, t \in T\right \}\)$ será estacionario?
7. Considere una secuencia aleatorias \(\left \{\epsilon_{t}, t \geq 1 \right \}\) tal que \(\epsilon_{t}\) es independiente e idénticamente distribuida con media \(\mu_{\epsilon}\) y variancia \(\sigma_{\epsilon}^{2}\) . Defina el paseo aleatorio \(X_{t}\) como
\[X_{t}=\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t}\]
Media de \(X_{t}\) \[ E(X_{t})=E(\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t})\] \[ = E(\epsilon_{1})+E(\epsilon_{2})+...+E(\epsilon_{t})\]
\[ = \mu_{\epsilon}+\mu_{\epsilon}+...+\mu_{\epsilon}= t \cdot \mu_{\epsilon}\]
Varianza de \(X_{t}\)
\[ Var(X_{t})=Var(\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t})\] \[ = Var(\epsilon_{1})+Var(\epsilon_{2})+...+Var(\epsilon_{t})\] \[ = \sigma_{\epsilon}^{2}+\sigma_{\epsilon}^{2}+...+\sigma_{\epsilon}^{2}= t \cdot \sigma_{\epsilon}^{2}\]
\[\gamma_{x}(t,s)=cov(x_{t},x_{s})\] Para el caso donde \(s=t\):
\[\gamma_{x}(t,t)=cov(x_{t},x_{t})=Var(x_{t},x_{t})=t \cdot \sigma_{\epsilon}^{2}\] Para el caso donde \(s=t+h\):
\[\gamma_{x}(t,t+h)=cov(x_{t},x_{t+h})\]
\[Cov[(\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t}),(\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t}+\epsilon_{t+h})]=\] \[=Cov(\epsilon_{1},\epsilon_{1})+Cov(\epsilon_{1},\epsilon_{2})+...+Cov(\epsilon_{1},\epsilon_{t})+Cov(\epsilon_{1},\epsilon_{t+h})+ \] \[Cov(\epsilon_{2},\epsilon_{2})+Cov(\epsilon_{2},\epsilon_{2})+...+Cov(\epsilon_{2},\epsilon_{t})+Cov(\epsilon_{2},\epsilon_{t+h})+\] \[...+Cov(\epsilon_{t},\epsilon_{1})+Cov(\epsilon_{t},\epsilon_{2})+...+Cov(\epsilon_{t},\epsilon_{t})+Cov(\epsilon_{t},\epsilon_{t+h}) \]
Dado que \(\epsilon_{t}\) es independiente las covarianzas donde los periodos son diferentes tienen \(Cov(\epsilon_{i},\epsilon_{j})=0\) para \(i \neq j\)
\[=Cov(\epsilon_{1},\epsilon_{1})+Cov(\epsilon_{2},\epsilon_{2})+...+Cov(\epsilon_{t},\epsilon_{t}) \]
\[=Var(\epsilon_{1},\epsilon_{1})+Var(\epsilon_{2},\epsilon_{2})+...+Var(\epsilon_{t},\epsilon_{t})=t \cdot \sigma_{\epsilon}^{2} \] Caso donde s=t-h
\[\gamma_{x}(t,t-h)=cov(x_{t},x_{t-h})\] \[Cov[(\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t-h}+\epsilon_{t}),(\epsilon_{1}+\epsilon_{2}+...+\epsilon_{t}+\epsilon_{t-h})]=\] \[=Cov(\epsilon_{1},\epsilon_{1})+Cov(\epsilon_{1},\epsilon_{2})+...+Cov(\epsilon_{1},\epsilon_{t})+Cov(\epsilon_{1},\epsilon_{t-h})+ \]
\[Cov(\epsilon_{2},\epsilon_{2})+Cov(\epsilon_{2},\epsilon_{2})+...+Cov(\epsilon_{2},\epsilon_{t-h})+\] \[...+Cov(\epsilon_{t-h},\epsilon_{1})+Cov(\epsilon_{t-h},\epsilon_{2})+...+Cov(\epsilon_{t-h},\epsilon_{t-h}) \]
\[...+Cov(\epsilon_{t},\epsilon_{1})+Cov(\epsilon_{t},\epsilon_{2})+...+Cov(\epsilon_{t},\epsilon_{t-h}) \]
Dado que \(\epsilon_{t}\) es independiente las covarianzas donde los periodos son diferentes tienen \(Cov(\epsilon_{i},\epsilon_{j})=0\) para \(i \neq j\)
\[=Cov(\epsilon_{1},\epsilon_{1})+Cov(\epsilon_{2},\epsilon_{2})+...+Cov(\epsilon_{t-h},\epsilon_{t-h}) \]
\[=Var(\epsilon_{1},\epsilon_{1})+Var(\epsilon_{2},\epsilon_{2})+...+Var(\epsilon_{t-h},\epsilon_{t-h})= (t-h) \cdot \sigma_{\epsilon}^{2} \]
entonces
\[ \gamma \left ( t,s \right )=\left\{\begin{matrix} t \cdot \sigma_{\epsilon}^{2} & s\geq t\\ (t-h) \cdot \sigma_{\epsilon}^{2} & s < t \end{matrix}\right.\]
\[\gamma \left ( t,s \right )=\sigma_{\epsilon}^{2}\cdot min(t,s)\]
Se concluye que \(X_{t}\) NO es estacionario debido a que la media no es constante y \(\gamma \left ( t,s \right )\) depende de t
#Tamaño
T <- 100
## Ruido blanco= Normal con media 0 y varianza 1
epsilon <- rnorm(T,0,1)
plot.ts(epsilon, col="royalblue2")
#Caminata aleatoria
X <- cumsum (epsilon)
plot.ts(X, col="red4")
xx<-1:100
lo <- loess(X~xx)
lines(predict(lo), col='red', lwd=2)
abline(h=mean(X), col='blue')
Como se observa en el gráfico anterior, la variable \(X\) no oscila de manera alrededor de la media (linea azul), ya que depende de t (tiempo)
9. Utilice la serie fpp2::goog de la bolsa de valores del Google entre 25 de febrero, 2013 a 13 de febrero, 2017.
accgoogle<-fpp2::goog
str(accgoogle)
## Time-Series [1:1000] from 1 to 1000: 393 393 397 398 400 ...
head(accgoogle)
## Time Series:
## Start = 1
## End = 6
## Frequency = 1
## [1] 392.8300 392.5121 397.3059 398.0113 400.4902 408.0957
pgoogle<-autoplot(accgoogle)+
theme_bw()
ggplotly(pgoogle)
\(Z_{t} = Y_{t} −Y_{t−1}\)
Zt mide el cambio que produce la observación en el tiempo t con respecto a la observación en el tiempo t − 1. Utilice la función diff(goog) para obtener los cambios diarios de la serie.
zt<-diff(accgoogle)
pzt<-autoplot(zt)+
theme_bw()
ggplotly(pzt)
pzt2<- ggAcf(zt)+
theme_bw()
ggplotly(pzt2)